Ustawienia

Wykorzystane biblioteki:

  • knitr,
  • dplyr,
  • EDAWR,
  • ggplot2

Wczytanie danych z cache’owaniem

Wyświetlenie typów danych, podsumowania tabeli oraz kilku pierwszych wierszy zbioru.

## tibble [3,800 × 6] (S3: tbl_df/tbl/data.frame)
##  $ country: chr [1:3800] "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
##  $ year   : int [1:3800] 1995 1995 1996 1996 1997 1997 1998 1998 1999 1999 ...
##  $ sex    : chr [1:3800] "female" "male" "female" "male" ...
##  $ child  : int [1:3800] NA NA NA NA 5 0 45 30 25 8 ...
##  $ adult  : int [1:3800] NA NA NA NA 96 26 1142 500 484 212 ...
##  $ elderly: int [1:3800] NA NA NA NA 1 0 20 41 8 8 ...
##    country               year          sex                child        
##  Length:3800        Min.   :1995   Length:3800        Min.   :    0.0  
##  Class :character   1st Qu.:1999   Class :character   1st Qu.:   25.0  
##  Mode  :character   Median :2004   Mode  :character   Median :   76.0  
##                     Mean   :2004                      Mean   :  493.2  
##                     3rd Qu.:2009                      3rd Qu.:  264.5  
##                     Max.   :2013                      Max.   :25661.0  
##                                                       NA's   :396      
##      adult           elderly        
##  Min.   :     0   Min.   :     0.0  
##  1st Qu.:  1128   1st Qu.:    84.5  
##  Median :  2589   Median :   230.0  
##  Mean   : 10864   Mean   :  1253.0  
##  3rd Qu.:  6706   3rd Qu.:   640.0  
##  Max.   :731540   Max.   :125991.0  
##  NA's   :413      NA's   :413
## # A tibble: 6 × 6
##   country      year sex    child adult elderly
##   <chr>       <int> <chr>  <int> <int>   <int>
## 1 Afghanistan  1995 female    NA    NA      NA
## 2 Afghanistan  1995 male      NA    NA      NA
## 3 Afghanistan  1996 female    NA    NA      NA
## 4 Afghanistan  1996 male      NA    NA      NA
## 5 Afghanistan  1997 female     5    96       1
## 6 Afghanistan  1997 male       0    26       0

Zbiór danych zawiera 3800 rekordów, które przedstawiają informacje o liczbie zachorowań na gruźlicę w różnych krajach w latach 1995-2013. Atrybuty zbioru danych to: kraj(‘country’), rok(‘year’), płeć(‘sex’) oraz 3 atrybuty z przydziałem do grupy wiekowej: dzieci, dorośli i osoby starsze(‘child’, ‘adult’, ‘elderly’).

Podsumowanie liczby zachorowań z podziałem na płeć

Dokonujemy podsumowania ze względu na liczbę wystąpień choroby u każdej z płci. Sumujemy dzieci, dorosłych i osoby starsze w każdej grupie. Generujemy wykres kolumnowy dla każdej z płci.

## # A tibble: 2 × 2
##   sex       total
##   <chr>     <int>
## 1 female 15656162
## 2 male   27062807

Podsumowanie sumarycznej liczby zachorowań wśród dzieci, dorosłych i osób starszych w kolejnych latach

Grupujemy dane po latach i tworzymy podsumowania osobno dla dzieci, dorosłych oraz osób starszych. Generujemy wykres liniowy zachorowań dla każdej grupy wiekowej w kolejnych latach.

Podsumowanie sumarycznej liczby zachorowań wśród dzieci, dorosłych i osób starszych w kolejnych latach z podziałem na kraje

Grupujemy dane po krajach oraz latach i tworzymy podsumowania osobno dla dzieci, dorosłych oraz osób starszych. Generujemy wykresy liniowe zachorowań dla każdej grupy wiekowej w kolejnych latach z podziałem na kraje.